Model Selection

ImageNet-21k Pretrained

# ImageNet-21k Pretrained

Vit Base Patch16 224.orig In21k

An image classification model based on Vision Transformer, pretrained on ImageNet-21k, suitable for feature extraction and fine-tuning

Image Classification

Vit Large Patch32 224.orig In21k

An image classification model based on Vision Transformer (ViT) architecture, pretrained on the ImageNet-21k dataset, suitable for feature extraction and fine-tuning scenarios.

Image Classification

Swin Base Patch4 Window7 224 In22k

Swin Transformer is a hierarchical window-based vision Transformer model pretrained on the ImageNet-21k dataset, suitable for image classification tasks.

Image Classification

Swin Base Patch4 Window12 384 In22k

Swin Transformer is a hierarchical vision Transformer based on shifted windows, specifically designed for image classification tasks.

Image Classification

Swin Large Patch4 Window12 384 In22k

Swin Transformer is a hierarchical window-based vision Transformer model, pretrained on the ImageNet-21k dataset, suitable for image classification tasks.

Image Classification

Swin Large Patch4 Window7 224 In22k

Swin Transformer is a hierarchical vision transformer based on shifted windows, pretrained on the ImageNet-21k dataset, suitable for image classification tasks.

Image Classification

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase